Exploración de los datos abiertos de COVID-19 México


Síguenos en nuestra página de Facebook "Análisis y visualización de datos"

https://www.facebook.com/An%C3%A1lisis-y-visualizaci%C3%B3n-de-datos-100602148375744/?ti=as

Introducción

La pandemia COVID-19 es uno de las peores situaciones que nos ha tocado vivir en México y en el mundo en los últimos años. Si bien, podemos obtener información acerca de la situación de esta pandemia en nuestro país en las conferencias emitidas diariamente, siempre quedan preguntas o nos surge algún interés en particular. Para esto, la Secretaría de Salud en su página de COVID publica los datos abiertos que utilizan para realizar algunos de los los análisis que muestran diario. El tener disponibles estos datos nos permite explorar más allá de lo que nos muestran, resolver nuestros propios intereses y tratar de estar mejor informados y cuestionarnos acerca de lo que los medios informan.

En esta ocasión, decidí trabajar en los los Datos Abiertos de COVID-19 para poder compartirlo con ustedes, presentando distintas visualizaciones que nos ayuden a entender como ha ido evolucionando la pandemia en el pais y mantenernos informados en algo que es de interés público. Al mismo tiempo, si tienen alguna duda, interés en explorar algo o comentarios acerca del análisis, me pueden dejar sus comentarios en nuestra página de Facebook "Análisis y visualización de datos". El análisis lo estoy actualizando periódicamente.

Cabe aclarar que en esta exploración de los datos de COVID19 no muestro modelos ni predicciones ya que no estoy especializado en cuestiones epidemiológicas.

En una vista rápida de los datos, con un formato más completo, podemos ver la siguente información:

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
0 2020-08-31 081e8e 2 IMSS 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-04-24 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO COYOACÁN
1 2020-08-31 0eb8a6 2 ESTATAL 27 HOMBRE TABASCO TABASCO HOSPITALIZADO 2020-05-03 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO CENTRO
2 2020-08-31 1485e2 2 ESTATAL 27 MUJER TABASCO TABASCO AMBULATORIA 2020-07-02 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA CENTRO
3 2020-08-31 0f42c5 2 IMSS 15 HOMBRE GUANAJUATO MEXICO HOSPITALIZADO 2020-04-17 ... SI NO SI NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO ECATEPEC DE MORELOS
4 2020-08-31 069de6 2 IMSS 9 MUJER CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-04-16 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALPAN

5 rows × 35 columns

Exploración de los datos

Los datos contienen a todos los sujetos que se han analizado hasta el momento (confirmados, negativos y pendientes).

El siguiente resultado contiene el número de sujetos(renglones) y el número de variables (columnas) presente:

(1345483, 35)

La tabla contiene las siguientes columnas las cuales pueden revisar para generar nuevas preguntas dependiendo de su interés.

Index(['FECHA_ACTUALIZACION', 'ID_REGISTRO', 'ORIGEN', 'SECTOR', 'ENTIDAD_UM',
       'SEXO', 'ENTIDAD_NAC', 'ENTIDAD_RES', 'TIPO_PACIENTE', 'FECHA_INGRESO',
       'FECHA_SINTOMAS', 'FECHA_DEF', 'INTUBADO', 'NEUMONIA', 'EDAD',
       'NACIONALIDAD', 'EMBARAZO', 'HABLA_LENGUA_INDIG', 'DIABETES', 'EPOC',
       'ASMA', 'INMUSUPR', 'HIPERTENSION', 'OTRA_COM', 'CARDIOVASCULAR',
       'OBESIDAD', 'RENAL_CRONICA', 'TABAQUISMO', 'OTRO_CASO', 'RESULTADO',
       'MIGRANTE', 'PAIS_NACIONALIDAD', 'PAIS_ORIGEN', 'UCI', 'MUNICIPIO'],
      dtype='object')

Antes de continuar, debemos aclarar algunas variables presentes en los datos que estan realacionadas con fechas:

  • FECHA_ACTUALIZACIÓN: Corresponde a la fecha de los datos publicados.
  • FECHA_INGRESO: Fecha en la que el paciente ingreso al hospital.
  • FECHA_SINTOMAS: Fecha en la que el paciente empezó con los síntomas.
  • FECHA_DEF: Presenta fecha sí el paciente desafortunadamente falleció.

Datos generales

A partir de la tabla anterior ocupamos la columna RESULTADO para contar a los sujetos con resultado a la prueba de COVID-19 positivos, negativos o pendientes.

Número de personas confirmadas con COVID-19: 599560
Número de personas con resultado negativo a COVID-19: 668193
Número de personas que esperan un resultado de la prueba de COVID-19: 77730
Número de fallecimientos con COVID-19 positivo: 64414
Número de sujetos analizados hasta el momento: 1345483

Algo que notamos en los datos es la presencia de sujetos que tienen una confirmación en la prueba de COVID-19, pero que su fecha de SINTOMAS fue antes de los primeros casos de COVID-19 en México (finales de Febrero).

En una conferencia se aclaró que estas incosistencias se deben a errores al momento de registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
7382 2020-08-31 044a42 2 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA GUSTAVO A. MADERO
15834 2020-08-31 05f3d3 1 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO SI SI POSITIVO NO ESPECIFICADO México 99 SI IZTAPALAPA
29330 2020-08-31 189846 2 SSA 15 HOMBRE CIUDAD DE MEXICO MEXICO AMBULATORIA 2020-02-28 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALNEPANTLA DE BAZ
30333 2020-08-31 135d2f 2 SSA 25 HOMBRE CIUDAD DE MEXICO HIDALGO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA PACHUCA DE SOTO
52810 2020-08-31 17235f 2 IMSS 19 HOMBRE NUEVO LEON NUEVO LEON AMBULATORIA 2020-01-13 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA SAN NICOLÁS DE LOS GARZA
113931 2020-08-31 18ecd7 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO MEXICO HOSPITALIZADO 2020-04-01 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 SI NEZAHUALCÓYOTL
126180 2020-08-31 1732a3 2 IMSS 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA HOSPITALIZADO 2020-04-14 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TIJUANA
135101 2020-08-31 12a243 2 SSA 9 MUJER CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-24 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALPAN
148595 2020-08-31 04f68c 2 PRIVADA 15 HOMBRE NO ESPECIFICADO MEXICO HOSPITALIZADO 2020-03-04 ... NO NO NO NO POSITIVO NO ESPECIFICADO Italia 99 NO HUIXQUILUCAN
148957 2020-08-31 0aad01 2 SSA 7 MUJER CIUDAD DE MEXICO CHIAPAS AMBULATORIA 2020-02-29 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TUXTLA GUTIÉRREZ
149675 2020-08-31 06e286 2 SSA 5 MUJER COAHUILA DE ZARAGOZA COAHUILA DE ZARAGOZA AMBULATORIA 2020-02-28 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA TORREÓN
153649 2020-08-31 0f634f 1 IMSS 25 MUJER SINALOA SINALOA AMBULATORIA 2020-01-29 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA CULIACÁN
280453 2020-08-31 194f98 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO MIGUEL HIDALGO
626649 2020-08-31 178775 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-04-02 ... NO NO NO SI PENDIENTE NO ESPECIFICADO México 99 NO APLICA IZÚCAR DE MATAMOROS
628134 2020-08-31 003ca9 2 IMSS 22 HOMBRE QUERETARO QUERETARO AMBULATORIA 2020-02-07 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA QUERÉTARO
630810 2020-08-31 06cf4c 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-03-30 ... NO NO NO NO PENDIENTE NO ESPECIFICADO México 99 NO APLICA PUEBLA
631850 2020-08-31 063f1e 2 IMSS 20 HOMBRE OAXACA OAXACA AMBULATORIA 2020-01-30 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA NAZARENO ETLA
632675 2020-08-31 114288 2 IMSS 19 MUJER NUEVO LEON NUEVO LEON HOSPITALIZADO 2020-05-15 ... SI SI SI NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO LINARES

18 rows × 35 columns

Como primera visualización podemos ver una gráfica de barras los valores NEGATIVOS, POSITIVOS y PENDIENTES por día.

Confirmados con COVID-19

La columna ENTIDAD_RES contiene la entidad en donde se encontraba el sujeto al momento de registrar sus datos.

Podemos agrupar los datos y presentarlos en una tabla con un gradiente para mostrar los Estados con mayor número de casos de COVID-19.

ENTIDAD TOTAL
0 CIUDAD DE MEXICO 98450
1 MEXICO 67828
2 GUANAJUATO 31662
3 NUEVO LEON 29083
4 TABASCO 28354
5 VERACRUZ DE IGNACIO DE LA LLAVE 28264
6 PUEBLA 26899
7 TAMAULIPAS 24452
8 COAHUILA DE ZARAGOZA 21607
9 SONORA 21433
10 JALISCO 20324
11 SAN LUIS POTOSI 18113
12 BAJA CALIFORNIA 16875
13 SINALOA 16104
14 MICHOACAN DE OCAMPO 15116
15 GUERRERO 14793
16 YUCATAN 14773
17 OAXACA 13699
18 QUINTANA ROO 10313
19 HIDALGO 10275
20 CHIHUAHUA 7710
21 BAJA CALIFORNIA SUR 7624
22 DURANGO 6394
23 TLAXCALA 6374
24 QUERETARO 6320
25 CHIAPAS 6267
26 AGUASCALIENTES 5631
27 CAMPECHE 5586
28 ZACATECAS 5312
29 MORELOS 5211
30 NAYARIT 5003
31 COLIMA 3711

O representarlo en una gráfica de barras.

También podemos agrupar los casos confirmados por día y su acumulado.

FECHA TOTAL TOTAL_ACCU
0 2020-01-13 00:00:00 1 1
1 2020-01-29 00:00:00 1 2
2 2020-02-06 00:00:00 1 3
3 2020-02-19 00:00:00 1 4
4 2020-02-21 00:00:00 1 5
5 2020-02-22 00:00:00 2 7
6 2020-02-23 00:00:00 1 8
7 2020-02-24 00:00:00 1 9
8 2020-02-25 00:00:00 1 10
9 2020-02-26 00:00:00 1 11
10 2020-02-27 00:00:00 2 13
11 2020-02-28 00:00:00 2 15
12 2020-02-29 00:00:00 2 17
13 2020-03-01 00:00:00 6 23
14 2020-03-02 00:00:00 8 31
15 2020-03-03 00:00:00 6 37
16 2020-03-04 00:00:00 7 44
17 2020-03-05 00:00:00 7 51
18 2020-03-06 00:00:00 10 61
19 2020-03-07 00:00:00 21 82
20 2020-03-08 00:00:00 21 103
21 2020-03-09 00:00:00 64 167
22 2020-03-10 00:00:00 50 217
23 2020-03-11 00:00:00 51 268
24 2020-03-12 00:00:00 60 328
25 2020-03-13 00:00:00 88 416
26 2020-03-14 00:00:00 91 507
27 2020-03-15 00:00:00 100 607
28 2020-03-16 00:00:00 133 740
29 2020-03-17 00:00:00 111 851
30 2020-03-18 00:00:00 123 974
31 2020-03-19 00:00:00 113 1087
32 2020-03-20 00:00:00 183 1270
33 2020-03-21 00:00:00 132 1402
34 2020-03-22 00:00:00 141 1543
35 2020-03-23 00:00:00 222 1765
36 2020-03-24 00:00:00 183 1948
37 2020-03-25 00:00:00 211 2159
38 2020-03-26 00:00:00 249 2408
39 2020-03-27 00:00:00 289 2697
40 2020-03-28 00:00:00 276 2973
41 2020-03-29 00:00:00 267 3240
42 2020-03-30 00:00:00 388 3628
43 2020-03-31 00:00:00 311 3939
44 2020-04-01 00:00:00 467 4406
45 2020-04-02 00:00:00 440 4846
46 2020-04-03 00:00:00 445 5291
47 2020-04-04 00:00:00 454 5745
48 2020-04-05 00:00:00 434 6179
49 2020-04-06 00:00:00 587 6766
50 2020-04-07 00:00:00 517 7283
51 2020-04-08 00:00:00 630 7913
52 2020-04-09 00:00:00 635 8548
53 2020-04-10 00:00:00 969 9517
54 2020-04-11 00:00:00 734 10251
55 2020-04-12 00:00:00 781 11032
56 2020-04-13 00:00:00 975 12007
57 2020-04-14 00:00:00 917 12924
58 2020-04-15 00:00:00 1057 13981
59 2020-04-16 00:00:00 1040 15021
60 2020-04-17 00:00:00 1186 16207
61 2020-04-18 00:00:00 1279 17486
62 2020-04-19 00:00:00 1154 18640
63 2020-04-20 00:00:00 1879 20519
64 2020-04-21 00:00:00 1235 21754
65 2020-04-22 00:00:00 1270 23024
66 2020-04-23 00:00:00 1323 24347
67 2020-04-24 00:00:00 1571 25918
68 2020-04-25 00:00:00 1632 27550
69 2020-04-26 00:00:00 1456 29006
70 2020-04-27 00:00:00 1783 30789
71 2020-04-28 00:00:00 1570 32359
72 2020-04-29 00:00:00 1418 33777
73 2020-04-30 00:00:00 1972 35749
74 2020-05-01 00:00:00 2673 38422
75 2020-05-02 00:00:00 1929 40351
76 2020-05-03 00:00:00 1831 42182
77 2020-05-04 00:00:00 2333 44515
78 2020-05-05 00:00:00 2350 46865
79 2020-05-06 00:00:00 2111 48976
80 2020-05-07 00:00:00 2352 51328
81 2020-05-08 00:00:00 2721 54049
82 2020-05-09 00:00:00 2418 56467
83 2020-05-10 00:00:00 3255 59722
84 2020-05-11 00:00:00 3015 62737
85 2020-05-12 00:00:00 2730 65467
86 2020-05-13 00:00:00 2663 68130
87 2020-05-14 00:00:00 2672 70802
88 2020-05-15 00:00:00 3948 74750
89 2020-05-16 00:00:00 3007 77757
90 2020-05-17 00:00:00 2875 80632
91 2020-05-18 00:00:00 4133 84765
92 2020-05-19 00:00:00 3228 87993
93 2020-05-20 00:00:00 4403 92396
94 2020-05-21 00:00:00 3049 95445
95 2020-05-22 00:00:00 3849 99294
96 2020-05-23 00:00:00 3553 102847
97 2020-05-24 00:00:00 3339 106186
98 2020-05-25 00:00:00 5022 111208
99 2020-05-26 00:00:00 3686 114894
100 2020-05-27 00:00:00 3516 118410
101 2020-05-28 00:00:00 4000 122410
102 2020-05-29 00:00:00 4068 126478
103 2020-05-30 00:00:00 3907 130385
104 2020-05-31 00:00:00 3644 134029
105 2020-06-01 00:00:00 6616 140645
106 2020-06-02 00:00:00 4143 144788
107 2020-06-03 00:00:00 4103 148891
108 2020-06-04 00:00:00 4251 153142
109 2020-06-05 00:00:00 5249 158391
110 2020-06-06 00:00:00 4939 163330
111 2020-06-07 00:00:00 4195 167525
112 2020-06-08 00:00:00 5581 173106
113 2020-06-09 00:00:00 4530 177636
114 2020-06-10 00:00:00 6081 183717
115 2020-06-11 00:00:00 4420 188137
116 2020-06-12 00:00:00 5161 193298
117 2020-06-13 00:00:00 4599 197897
118 2020-06-14 00:00:00 4462 202359
119 2020-06-15 00:00:00 6866 209225
120 2020-06-16 00:00:00 5164 214389
121 2020-06-17 00:00:00 4464 218853
122 2020-06-18 00:00:00 5455 224308
123 2020-06-19 00:00:00 5553 229861
124 2020-06-20 00:00:00 7177 237038
125 2020-06-21 00:00:00 4592 241630
126 2020-06-22 00:00:00 5857 247487
127 2020-06-23 00:00:00 5090 252577
128 2020-06-24 00:00:00 5031 257608
129 2020-06-25 00:00:00 5998 263606
130 2020-06-26 00:00:00 6496 270102
131 2020-06-27 00:00:00 5093 275195
132 2020-06-28 00:00:00 6078 281273
133 2020-06-29 00:00:00 6448 287721
134 2020-06-30 00:00:00 6393 294114
135 2020-07-01 00:00:00 8104 302218
136 2020-07-02 00:00:00 5934 308152
137 2020-07-03 00:00:00 6375 314527
138 2020-07-04 00:00:00 5584 320111
139 2020-07-05 00:00:00 6109 326220
140 2020-07-06 00:00:00 6780 333000
141 2020-07-07 00:00:00 6142 339142
142 2020-07-08 00:00:00 5636 344778
143 2020-07-09 00:00:00 5741 350519
144 2020-07-10 00:00:00 8734 359253
145 2020-07-11 00:00:00 5612 364865
146 2020-07-12 00:00:00 5933 370798
147 2020-07-13 00:00:00 7159 377957
148 2020-07-14 00:00:00 5971 383928
149 2020-07-15 00:00:00 7530 391458
150 2020-07-16 00:00:00 5978 397436
151 2020-07-17 00:00:00 6727 404163
152 2020-07-18 00:00:00 6680 410843
153 2020-07-19 00:00:00 5911 416754
154 2020-07-20 00:00:00 9223 425977
155 2020-07-21 00:00:00 5577 431554
156 2020-07-22 00:00:00 5544 437098
157 2020-07-23 00:00:00 5431 442529
158 2020-07-24 00:00:00 5909 448438
159 2020-07-25 00:00:00 6862 455300
160 2020-07-26 00:00:00 5175 460475
161 2020-07-27 00:00:00 6667 467142
162 2020-07-28 00:00:00 5516 472658
163 2020-07-29 00:00:00 4689 477347
164 2020-07-30 00:00:00 4842 482189
165 2020-07-31 00:00:00 5055 487244
166 2020-08-01 00:00:00 7420 494664
167 2020-08-02 00:00:00 4847 499511
168 2020-08-03 00:00:00 5801 505312
169 2020-08-04 00:00:00 4509 509821
170 2020-08-05 00:00:00 5179 515000
171 2020-08-06 00:00:00 4395 519395
172 2020-08-07 00:00:00 4890 524285
173 2020-08-08 00:00:00 5056 529341
174 2020-08-09 00:00:00 4166 533507
175 2020-08-10 00:00:00 6901 540408
176 2020-08-11 00:00:00 4361 544769
177 2020-08-12 00:00:00 4303 549072
178 2020-08-13 00:00:00 4206 553278
179 2020-08-14 00:00:00 4826 558104
180 2020-08-15 00:00:00 5128 563232
181 2020-08-16 00:00:00 4018 567250
182 2020-08-17 00:00:00 4781 572031
183 2020-08-18 00:00:00 4580 576611
184 2020-08-19 00:00:00 3696 580307
185 2020-08-20 00:00:00 4867 585174
186 2020-08-21 00:00:00 3428 588602
187 2020-08-22 00:00:00 2871 591473
188 2020-08-23 00:00:00 2430 593903
189 2020-08-24 00:00:00 2397 596300
190 2020-08-25 00:00:00 1614 597914
191 2020-08-26 00:00:00 993 598907
192 2020-08-27 00:00:00 489 599396
193 2020-08-28 00:00:00 143 599539
194 2020-08-29 00:00:00 21 599560

No solo podemos revisar los casos confirmados también ver el número de fallecimientos por día y su acumulado.

Antes de las visualizaciones observamos otra inconsistencia en sujetos que tienen registrada una fecha de defunción pero antes de que se registrará la fecha de los sintomas o personas con fecha de fallecimiento antes de los primeros casos de COVID-19 en México.

Comó se menciono anteriormente, esto puede ser por un error al registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO FECHA_SINTOMAS FECHA_DEF INTUBADO NEUMONIA
289634 2020-08-31 14ca54 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-02-11 2020-02-11 2020-03-01 SI SI
622872 2020-08-31 1731ab 1 IMSS 9 MUJER MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-05-24 2020-05-24 2020-04-13 NO SI
1214953 2020-08-31 009132 1 IMSS 27 HOMBRE TABASCO TABASCO HOSPITALIZADO 2020-07-29 2020-07-29 2020-06-29 NO SI

Una manera de visualizar los datos de confirmados y fallecimientos es mediante un gráfico de área ya que en este caso los fallecimientos contados son un grupo de los sujetos confirmados y podemos comparar su proporción.

O gráficar con barras para cada día.

Preguntas que podemos explorar

Utilizando los datos de los casos confirmados, ¿Cuántos ingresaron en hospitales?

Para esto ocupamos la columna TIPO_PACIENTE que contiene valores como Hospitalizado que significa que esta o estuvo presente en un Hospital y Ambulatoria que significa que fue confirmado con COVID-19 pero que no ingreso a un hospital.

Seleccionando a los sujetos confirmados con COVID-19 y que se ingresaron en algún hospital, ¿Cuántos fueron entubados?

Para responder esto ocupamos la columna INTUBADO en la que se señala si el sujeto tuvo que ser intubado como un signo de la complicación de la enfermedad.

TIPO_PACIENTE SEXO CONTEOS
0 AMBULATORIA HOMBRE 221619
1 AMBULATORIA MUJER 225532
2 HOSPITALIZADO HOMBRE 92979
3 HOSPITALIZADO MUJER 59430

Podemos ocupar un gráfico de box plot para saber la distribución de la edad de las personas confirmadas que se encontraron en el hospital.

Podemos crear rangos de edad y observar que grupo es el que ha presentado más casos que requieran hospitalización.

En México siempre se ha mantenido las "noticias" acerca de que los hospitales se encuentran llenos y hemos visto las conferencias acerca de la expansión en hospitales dependendiendo de la situación que se encuentran los Estados. Lamentablemente, con los datos que estamos trabajando en este momento no hay información de esta capacidad en hospitales pero si podemos visualizar el número de personas que se encontraron en los distintos tipos de hospitales.

Commorbilidades

Otro problema que existe en México son las enfermedades que complican la condición del paciente con COVID-19. Entre las más importantes se encuentran Obesidad, Diabetes e Hipertensión. Observando los datos registrados hasta 2016, México presenta un crecimiento en el porcentaje de adultos con obesidad cada año. La siguente gráfica muestra el porcentaje en distintos paises desde 1975 al 2016, incluyendo Mexico.

Ahora en relación con COVID-19, podemos ver el número de personas confirmadas, saber si presentan obesidad y su condición en el hospital.

La misma situación pero con las otras dos cormobilidades, Diabetes e hipertension que estan estrechamente relacionadas con la Obesidad.

Siguiendo el interés de las co-morbilidades podemos clasificar cada paciente con el número de las enfermades que se mencionaron anteriormente ya que son las que presentaron y presentan un mayor riesgo.

Hasta el momento, solo hemos explorado los datos de las personas confirmadas con COVID-19 desde el inicio de la pandemia en México, no las personas que actualmente presentan la enfermedad.

Usando el número de personas confirmadas con COVID19 y con la población total de cada Estado (datos de 2017) podemos determinar el número total de fallecimientos en cada Estado por cada 100 000 habitantes.

O la otra manera que podemos ver los lamentables fallecimientos es por el total de confirmados de COVID-19 en cada Estado. No es la forma más adecuada de ver estos datos, ya que como han explicado, depende mucho del número de pruebas que se hacen. Por lo que muchas pruebas solo reduciría la proporción de fallecimientos por total de confirmados. Pero puede ser útil para ver algúna localidad en la que la proporcion de falleciemientos aumente y tratar de determinar las posibles causas.

Otra manera de ver la relación entre el número de fallecimientos y el número de confirmados mediante un gráfico denominado scatterplot en el que cada punto representa una entidad Federativa.

El siguiente gráfico muestra los casos confirmados en cada Estado desde el inicio de la pandemia en México hasta el día de hoy.

Ya que los datos presentan tanto el Estado como el minicipio podemos realizar un gráfico denominado treemap que nos permite observar los casos totales por localidad y el tamaño de los cuadros es por número correspondiente.

En el caso de los Recuperados, según los informes de la Secretaría de Salud, son los casos después de 15 días al inicio de los síntomas.

Si seleccionamos los casos confirmados de las últimas dos semanas tendríamos los casos que se consideran activos ya que se toma en cuenta que la enfermedad tiene una duración promedio de 14 días. Puede ser que esta restricción no contemple todos los activos ya que pueden existir casos en los que la recuperación sea lenta sin embargo, una alta proporcion de los casos activos se encuentran con el criterio tomado.

Podemos ocupar estos casos activos para generar un treemap.

Casos Por día

Una manera de poder ver el número de casos nuevos por dia es usando un heatmap en que podemos ver el crecimiento de casos por cada 100K personas del Estado. Para poder apreciar mejor el número de casos se calcula el logaritmo base 10. La idea original de esta visualización la puedes encontrar en el siguente artículo:

https://towardsdatascience.com/visualization-of-covid-19-new-cases-over-time-in-python-8c6ac4620c88

Duración epidémica

También es posible explorar la duración de la epidemia COVID19 en cada uno de los Estados. Esto quiere decir tomar el registro de cuando se dio el primer caso confirmado de COVID19 en cada uno de los Estados y continuar el lapso hasta el último día en el que se registro una confirmació. De esta manera podremos ver si algún Estado ha dejado de tener casos.

Debido a los errores al momento de registrar los datos, como se mencionó anteriormente, se tomarán en cuenta solo los datos a partir de inicios de Marzo 2020 que fue de las fechas oficiales.

Teniendo en cuenta este último gráfico, podemos revisar por día como fueron los distintos casos (no acumulados).

El siguente calendario muestra la intensidad de los casos confirmados en todo México por día. Es necesario considerar que debido a los errores de anotación que se describieron anteriormente el calendario iniciaria en Enero y Febrero cuando no en realidad no fue asi. Sin embargo, no se eliminaron ya que cuentan como casos postivos.

También es posible revisar los casos recuperados y observarlos en un calendario.

Y por último los fallecimientos por día.